3 research outputs found
Computer Graphics and Video Features for Speaker Recognition
Tato práce popisuje netradiÄŤnĂ metodu rozpoznávánĂ Ĺ™eÄŤnĂka pomocĂ pĹ™ĂznakĹŻ a alogoritmĹŻ pouĹľĂvanĂ˝ch pĹ™evážnÄ› v poÄŤĂtaÄŤovĂ©m vidÄ›nĂ. V Ăşvodu jsou shrnuty potĹ™ebnĂ© teoretickĂ© znalosti z oblasti poÄŤĂtaÄŤovĂ©ho rozpoznávánĂ. Jako aplikace grafickĂ˝ch pĹ™ĂznakĹŻ v rozpoznávánĂ Ĺ™eÄŤnĂka jsou detailnÄ›ji popsány jiĹľ známĂ© BBF pĹ™Ăznaky. Tyto jsou vyhodnoceny nad standardnĂmi Ĺ™eÄŤovĂ˝mi databázemi TIMIT a NIST SRE 2010. ExperimentálnĂ vĂ˝sledky jsou shrnuty a porovnány se standardnĂmi metodami. V závÄ›ru jsou jsou navrĹľeny moĹľnĂ© smÄ›ry budoucĂ práce.We describe a non-traditional method for speaker recognition that uses features and algorithms used mainly for computer vision. Important theoretical knowledge of computer recognition is summarized first. The Boosted Binary Features are described and explored as an already proposed method, that has roots in computer vision. This method is evaluated on standard speaker recognition databases TIMIT and NIST SRE 2010. Experimental results are given and compared to standard methods. Possible directions for future work are proposed at the end.
Speaker Recognition Based on Long Temporal Context
Tato práce se zabĂ˝vá extrakcĂ vhodnĂ˝ch pĹ™ĂznakĹŻ pro rozpoznávánĂ Ĺ™eÄŤnĂka z delšĂch ÄŤasovĂ˝ch ĂşsekĹŻ. Po pĹ™edstavenĂ souÄŤasnĂ˝ch technik pro extrakci takovĂ˝ch pĹ™ĂznakĹŻ navrhujeme a popisujeme novou metodu pracujĂcĂ v ÄŤasovĂ©m rozsahu fonĂ©mĹŻ a vyuĹľĂvajĂcĂ známou techniku i-vektorĹŻ. VelkĂ© ĂşsilĂ bylo vynaloĹľeno na nalezenĂ vhodnĂ© reprezentace temporálnĂch pĹ™ĂznakĹŻ, dĂky kterĂ˝m by mohly bĂ˝t systĂ©my pro rozpoznávánĂ Ĺ™eÄŤnĂka robustnÄ›jšĂ, zejmĂ©na modelovánĂ prosodie. Náš pĹ™Ăstup nemodeluje explicitnÄ› žádnĂ© specifickĂ© temporálnĂ parametry Ĺ™eÄŤi, namĂsto toho pouĹľĂvá kookurenci Ĺ™eÄŤovĂ˝ch rámcĹŻ jako zdroj temporálnĂch pĹ™ĂznakĹŻ. Tuto techniku testujeme a analyzujeme na Ĺ™eÄŤovĂ© databázi NIST SRE 2008. Z vĂ˝sledkĹŻ bohuĹľel vyplĂ˝vá, Ĺľe pro rozpoznávánĂ Ĺ™eÄŤnĂka tato technika nepĹ™inášà oÄŤekávanĂ© zlepšenĂ. Tento fakt diskutujeme a analyzujeme ke konci práce